1 引言 Introduction



在生成随机数字方面,较常用的模块是NumPy。不过NumPy默认生成是是数组(nd array),不是列表,所以生成之后需要转换。

2 NumPy的随机数生成




# -*- coding: utf-8 -*- """ Created on Tue Jun 15 00:24:10 2021 @Software: Spyder @author: 盲区行者王 """ import numpy as np


np.random.random() Out[4]: 0.42932504744000544

还可以通过 random.seed() 方法的参数值,以保证每一次生成的随机数不变。(因此,计算机各种程序生成的随机数,事实上是“伪随机数”)

np.random.seed(1898) np.random.random() Out[35]: 0.3085519817311221 np.random.seed(1898) np.random.random() Out[36]: 0.3085519817311221 ##种子不变,生成的随机数不变


round(np.random.random(), 4) Out[38]: 0.4342



这里的 int 指的是 integer 整数。


这里的 int 指的是 integer 整数。


randint(low, high=None, size=None, dtype=int)


a1 = np.random.randint(low=1, high=100, size=1000000) ##一维数组 a1.tolist() ##转换成一个列表,非常庞大,不好展示 ##部分结果如下 67, 32, 99, 99, 81, 13, 24, 32, 45, 24, 87, 62, 98,

或者,我们也可以直接用列表推导式(List Comprehension)来生成:

list1 = [np.random.randint(1, 100) for _ in range(1000000)] ##大概耗时1秒钟


3 Excel 中100万个数字的排序

100万个整数,在excel中的排序应该是可以做的。Excel 在2007版以后,就可以处理这种百万量级的简单数据(最多越105万行)。我们可以用VBA生成100万个1-100的整数:

Sub dome() Dim arr(1 To 1000000, 1 To 1), i As Long Randomize For i = 1 To 1000000 arr(i, 1) = Int(Rnd() * 100) Next [a1].Resize(1000000, 1) = arr End Sub

Excel 2019 运行结果截图如下:


排序,点击 OK 。


最小取值是0,最大取值是994 Python中的冒泡排序


import numpy as np import random np.random.seed(1898) def bs(list): ## print("原始列表: ", list) for loc in range(len(list)-1, 0, -1): ##loc取值是从9到0 for i in range(loc): ##假设loc=9,i的取值是0到8 if list[i] > list[i+1]: list[i], list[i+1] = list[i+1], list[i] ## print("第", 9-loc+1, "趟: ", list) ## list1 = [10, 2, 5, 6, 8, 7, 9, 1, 3, 4] list1 = [np.random.randint(1, 100) for _ in range(1000000)] ##大概耗时3秒






5 小结 Conclusion


Excel的百万量级数据的排序效率还是很高的。虽然本人目前还不清楚它的具体算法。Python中的冒泡排序难以处理百万量级的数据。使用NumPy + 列表推导式,生成随机数列表最为方便。



import pandas as pd import numpy as np df = pd.DataFrame(np.random.randint(0, 100, (100, 4)), columns=list('abcd')) df.head() Out[1]: a b c d 0 20 38 34 43 1 80 10 90 52 2 35 14 90 2 3 70 15 86 72 4 98 49 92 98






